Stable Diffusion 3
https://gyazo.com/89de07ad57834fcd5f953c897fb5cbb2
技術レポートを近々公開
登録してみた基素.icon
モデル構造について
https://gyazo.com/74612a1289ab7d0a8ada765d622058a7
MMDiTアーキテクチャは、UViT(Hoogeboom et al, 2023)やDiT(Peebles & Xie, 2023)のような確立されたテキストから画像へのバックボーンを、トレーニングの過程で視覚的忠実度とテキストの整列を測定する際に凌駕する。 テキストエンコーダー
二つのCLIPとT5
T5(4.7B)を削除するとメモリ要件は小さくなるがテキストの生成に失敗しやすくなる
オプトアウトについて
@EMostaque: Opt-in as well of course, about 50:50 both ways. Technically this is tags for LAION and coordinated around that.
It's actually quite difficult due to size (eg what if your image is on a news site?)
Exploring other mechanisms for attribution etc, welcome constructive input.
@spawning_: Excited to announce that @StabilityAI have stepped up to honor artist opt-out requests in advance of the training of Stable Diffusion 3! 🧫🦾🎇 アーティストがオプトアウト(自分の作品をトレーニングしないように要求)できるように
これで気が済むのならどんどんやって欲しいnomadoor.icon
遅かれ早かれこの機能は必要になる基素.icon
7800万枚がオプトアウトされた
3000億枚確保できている
15億枚オプトアウト?基素.icon
↓旧情報、削除検討wogikaze.icon
@spawning_: Excited to announce that @StabilityAI have stepped up to honor artist opt-out requests in advance of the training of Stable Diffusion 3! 🧫🦾🎇 https://pbs.twimg.com/media/F8zX6QuWgAA68N5.jpg
これは3.0なのか?wogikaze.icon